home *** CD-ROM | disk | FTP | other *** search
/ The Atari Compendium / The Atari Compendium (Toad Computers) (1994).iso / files / umich / apps / other / dotplot.lzh / document / manual_1.dtp (.txt) next >
Encoding:
Timeworks Publisher/Publish It!  |  1991-09-16  |  50.4 KB  |  173 lines

  1. EDT.DOC
  2. The DOTPLOT Editor.
  3. In the DOTPLOT folder there is a second program called DTPLT_ED.PRG. This program enables you to change the defaults themselves of the DOTPLOT program. On running the editor you will get a screen looking like:
  4. You will recognize a multi button panel if you see one by now, so I guess this one will not give you too much trouble. The top-left block is for changing the default extensions of DNA and protein files, respectively. If one of these two buttons is clicked upon the program enters the editor mode and you are given the opportunity to edit the old extensions. Likewise you can edit the window- and score-values of the three standard protein score tables, these are all in the elongated box on the left site of the screen. In the middle are two small boxes; one to change the window and score of DNA comparison and the other the Quit option; to stop and leave the program.
  5. The whole of the right of the screen is dedicated to the three extra score tables. Of these the names, windows, scores and comments all can be edited in the same way as with the other tables. An additional option is ``Values''; when this button is clicked upon a new picture will fill your screen:
  6. As you can see it lists the complete set of values of the score table and this will fill allmost halve of your screen with, all but invisible small, lettering. Also present are an exit to return to your previous screen and an edit box. When you enter the second screen, the edit box reports on the Alanine-Alanine couple, and if you look at the table above you will see that the little box on the cross of the A-row and the A-column is indeed in reversed video. To change a value; just type in the new one and it will replace the old one. The corresponding box will switch to normal video and the next one will be activated. If you don't want to change all values but only some there are three ways to activate the box of your choice:
  7. Press <RETURN> and keep it pressed untill you reach the right box.
  8. Use the arrows on your keyboard.
  9. Simply use the mouse to click in the desired box to activate it.
  10. when you are finished click in ``Exit'' and then ``Quit''; all changes will be saved and DOTPLOT will be able to run with new sets of defaults and or a new table.
  11. INFPG5.TXT
  12. To explain this option I will have to tell you something more about the various methods of comparing proteins and their amino acids.
  13. When DNA files are compared the scoring is fairly simple: for every identical base the score is incremented. This method is also available for proteins, but there are other options as well. Some amino acids are chemically more related than others; Glycine (R-H) is nearer to Alanine (R-CH
  14. ) than to Cysteine (R-CH
  15. -SH). This fact can be expressed either as a fraction or as equality within a group.
  16. An other approach is to score for evolutionary relatedness. This means two processes have to be considered and expressed in a number. First, the chance of a certain codon mutating into another has to be calculated, and secondly, the fitness of this mutation has to be assessed. Both the chance and the fitness  have to be expressed by a single number.
  17. Both the chemical and the evolutionary method have been incorporated into DOTPLOT.
  18. The chemical scoring table is called ``JIMENEZ'' after the man who described it first (1). It does not score for individual amino acids but divides them in groups.
  19. The groups are:
  20. PAGST 
  21. QNEDBZ
  22. HKR  
  23. All amino acids within the group score equal (=1), between groups they score 0.
  24. The evolutionary approach is represented by ``DAYHOFF'' again named for an important contributor of this work (2), this is a completely individual scoring table. The relatedness of every amino acid with every other amino acid is expressed as a number between 0 and 2.73.
  25. There are three more tables available in DOTPLOT, the contents of which, as well as their names, defaults and comments can all be changed. So if you feel you have developed an improved scoring system you can change one of these tables to fit, complete with an appropriate name and defaults. If you choose to use a scoring table the next step of DOTPLOT is obvious.
  26. INFPG6.TXT
  27. INFPG7.TXT
  28. D/P.PI3
  29. fff@~f
  30. UUUP+
  31. UUUP+
  32. ???3>
  33. ?~????3>
  34. UUUP+
  35. UUUP+
  36. FPINFO.PI3
  37. fff@~f
  38. UUUP+
  39. UUUP+
  40. UUUP+
  41. UUUP+
  42. LOGO.PI3
  43. [-hja
  44. [5>eZ
  45. 1    rk3+
  46. IMK-E6
  47. a&^&&b>8
  48. u)J9#%*
  49. Uu%Hr%
  50. .B5KN
  51. fff@~f
  52. U>zHXj
  53. B%E_Kd
  54. !RI frdDg
  55. @@D,E!0
  56. dfc>1
  57. %oJL$
  58. )1EA 
  59. D,!    [d
  60. 51&I3
  61. QJBD P
  62. )$)(J
  63. $eSE*D
  64. "S5U]B
  65. reRRH
  66. 8FI2K
  67. KZnY2n
  68. F$!)"(
  69. S*VeR
  70. rFJE#R
  71. )9%R]IVL
  72. UIE%J\
  73. [UUUU)E%T
  74. UM)E%T
  75. Je*)V
  76. UM%E%
  77. O%5)*
  78. UZUu2
  79. UZUu2
  80. MK%U:
  81. UZSu2
  82. feU[U
  83. 5[]kk6
  84. [UWUfZ
  85. [UWUfY
  86. _m]MV
  87. :ejkz
  88. 94--]UQJTJ
  89. T2i2u
  90. HBp!$
  91. >"<G#
  92. 2B"RT 
  93. 0x<<@
  94. >b    $F
  95. @9J]T
  96. A1%"D
  97. |N$L$
  98.     BhQRR'>
  99. BKII"
  100. '''O9
  101. ?92y#I+t
  102. Ksg'3'
  103. *2'MET
  104. &3>L4
  105. # FB@
  106.   @BHbJH
  107.  A2HA"Ju)
  108. A%%:*
  109. D A!$ 
  110. D A!$ 
  111. 8PPAGE2.PI3
  112. fff@~f
  113. SCORE.PI3
  114. fff@~f
  115. UUUP+
  116. UUUP+
  117. UUUP+
  118. UUUP+
  119. No part of this publication may be copied in any form without the citation of the original artical : Karreman, C (1992) A dotplot program for the Atari ST, capable of assaying DNA and protein sequences. CABIOS 
  120.  No. 1
  121. DOTPLOT is a program for comparing two  protein or DNA sequences  and for doing so 
  122. quickly
  123.  interactively
  124. on the
  125. Atari ST.
  126. Contents
  127. Installation of DOTPLOT.
  128. Running DOTPLOT.
  129. DNA/Protein
  130. Scoring-tables
  131. Length
  132. Reverse
  133. Options.
  134. Zoom-in
  135. Show Homology
  136. Borders
  137. Shift
  138. Expand
  139. Change
  140. Conditions
  141. Parameters
  142. Output
  143. Another run
  144. The DOTPLOT editor.
  145. Principle of DOTPLOT.
  146. The files on the disk.
  147. Formats.
  148. References.
  149. 9.    
  150. Installation of DOTPLOT.
  151. For the installation of DOTPLOT you will need at least an Atari 1024 ST with a black and white monitor and one single-sided disk drive. Atari computers with more RAM memory, e.g. the Mega ST 2 or Mega ST 4 are also fine; a harddisk will speed up the loading and saving of your files considerably but is not necessary. A color monitor is not compatible with DOTPLOT; you need a high-resolution screen.
  152. Dotplot comes on one floppy disk that contains a total of four subdirectories (folders). The program itself, the program editor and all data files are in the DOTPLOT-folder, the data files are all in their own folder called DATA.
  153. To install DOTPLOT you will have to copy at least the DOTPLOT folder and its contents to the disk you are planning to use for running DOTPLOT. This can be another floppy disk but preferably it will be a logical sector of 
  154. our harddisk. Since DOTPLOT will be writing as well as reading the disk during the run, it can not be write-protected. This will make the disk very sensitive to any viruses that are in your system. So to install DOTPLOT, switch off your system (hard reset) and then, before you run anything else make a copy of your DOTPLOT disk. Keep the original disk write-protected at all times.
  155. The other two folders that are on the disk are called DNA and PROTEIN. They contain  two DNA and two protein sequence files respectively. When compared with each other by DOTPLOT they will reveal stretches of homology; this will give you some idea about the desirable default values and graphic output.
  156. Although the two latter folders are not absolutely necessary to run the program it is advisable to install these two folders on the same logical sector as your DOTPLOTfolder. The program will look for them, and the files contained in them, first.
  157. If you have copied all the folders you are ready to run DOTPLOT.
  158. Running DOTPLOT.
  159. To run DOTPLOT you start the program by double-clicking on DOTPLOT.PRG, this will load the program and start its execution. The first you will see is the same picture as on the front of these instructions, although it is a very nice picture and you can probably watch it for hours, a single click on one of the mousebuttons or pressing any key will stop the logo. Subsequently the program will ask you if you want any information.
  160. As is customary for most programs the thick-lined box is the default option: if <RETURN> is pressed this option is automarically selected. You can select "Yes" by clicking the left mousebutton after placing the mouse arrow in the in the "Yes"-box. If you want to have more information at this point, here is your opportunity. All the information, of course, is  also contained in this set of instructions. The built-in help files are accessible by looking up the item of interest on the INDEX-page (page 2) and selecting the corresponding page by typing the number on the prompt. It is also possible to browse by pressing <RETURN>. After you select "QUIT" the information mode is left behind and you will return to the next option. This is of course the same as you would have encountered if you hadn't opted for information in the first place.
  161. The first question of DOTPLOT.PRG.
  162. The next question of DOTPLOT will probably be of more interest to you as you are now getting impatient for some serious DOTPLOTting. Here your first real choice is made; either for DNA (or RNA see pages 8 and 9) or for proteins.
  163. The INDEX page of the built-in information.
  164. The DNA/Protein options.
  165. As can be seen by the thick lined box <RETURN> will get you the protein option.  Since this is the most used (right, thats why it is the default), this leaflet will first cover the events following your pressing <RETURN> or "clicking" the right-hand box. For DNA go directly to page 7.
  166. As soon as you have selected proteins you get your second choice to make.
  167. The score-table option.
  168. fBODY TEXT
  169. fCENTER
  170. fLEGEND
  171. fSPRING
  172. fSPRINGALL
  173.